期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于图注意力网络的全局图像描述生成方法
隋佳宏, 毛莺池, 于慧敏, 王子成, 平萍
《计算机应用》唯一官方网站    2023, 43 (5): 1409-1415.   DOI: 10.11772/j.issn.1001-9081.2022040513
摘要272)   HTML22)    PDF (2508KB)(174)    收藏

现有图像描述生成方法仅考虑网格的空间位置特征,网格特征交互不足,并且未充分利用图像的全局特征。为生成更高质量的图像描述,提出一种基于图注意力网络(GAT)的全局图像描述生成方法。首先,利用多层卷积神经网络(CNN)进行视觉编码,提取给定图像的网格特征和整幅图像特征,并构建网格特征交互图;然后,通过GAT将特征提取问题转化成节点分类问题,包括一个全局节点和多个局部节点,更新优化后可以充分利用全局和局部特征;最后,基于Transformer的解码模块利用改进的视觉特征生成图像描述。在Microsoft COCO数据集上的实验结果表明,所提方法能有效捕捉图像的全局和局部特征,在CIDEr(Consensus-based Image Description Evaluation)指标上达到了133.1%。可见基于GAT的全局图像描述生成方法能有效提高文字描述图像的准确度,从而可以使用文字对图像进行分类、检索、分析等处理。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于生成对抗网络的数据不确定性量化方法
王昊, 王子成, 张超, 马韵升
《计算机应用》唯一官方网站    2023, 43 (4): 1094-1101.   DOI: 10.11772/j.issn.1001-9081.2022030383
摘要261)   HTML10)    PDF (2018KB)(112)    收藏

针对直接使用高维、高频、含有噪声的现实世界数据进行数据处理时会导致估计器不可靠的问题,提出一种基于生成对抗网络(GAN)的数据不确定性量化方法。首先,通过GAN重构原始数据分布,构建噪声空间到原始数据空间的映射分布;其次,使用马尔可夫链蒙特卡洛(MCMC)方法抽取样本,从而得到基于原始数据分布的新样本;然后,基于指定的函数定义样本的不确定性置信区间;最后,使用置信区间对原始数据进行不确定性估计,并选择置信区间内的数据作为估计器使用的数据。实验结果表明,与使用原始数据相比,使用置信区间内的数据进行估计器训练达到性能上限所需要的样本数减少了50%;同时,对比原始训练数据,置信区间内的数据在达到相同测试精度时所需要的样本数平均降低了30%。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 基于改进单点多盒检测器的大坝缺陷目标检测方法
陈静, 毛莺池, 陈豪, 王龙宝, 王子成
计算机应用    2021, 41 (8): 2366-2372.   DOI: 10.11772/j.issn.1001-9081.2020101603
摘要303)      PDF (1651KB)(329)    收藏
为提升大坝安全运维的效率,大坝缺陷目标检测模型有助于辅助巡检人员进行缺陷检测。大坝缺陷几何形状多变,而采用传统卷积方式进行特征提取的单点多盒检测器(SSD)模型无法适应缺陷的几何变换。针对上述问题,提出可变形卷积单步多框检测器(DFSSD)模型。首先将原始SSD的主干网络VGG16中的标准卷积替换为可变形卷积,用于处理缺陷的几何变换,并且通过学习卷积偏移量来提升模型的空间信息建模能力;其次针对不同特征的尺寸,改进先验框比例,从而提高模型对条形特征的检测精度与模型的泛化能力;最后为解决训练集正负样本不均衡的问题,采用改进的非极大值抑制(NMS)算法来优化学习效果。实验结果表明:DFSSD模型较基准模型SSD在大坝缺陷图像上的平均检测精度提升了5.98%。相较于基于区域的更快卷积神经网络(Faster R-CNN)和SSD模型,DFSSD模型在大坝缺陷目标检测精度提升上有较好的效果。
参考文献 | 相关文章 | 多维度评价
4. 基于图注意力网络的全局图像描述生成方法
隋佳宏 毛莺池 于慧敏 王子成 平萍
《计算机应用》唯一官方网站   
录用日期: 2022-08-12